Vượt qua Ngưỡng Kiến thức
Các Mô hình Ngôn ngữ Lớn rất mạnh mẽ, nhưng lại bị hạn chế cơ bản: ngưỡng Kiến thức. Để xây dựng các hệ thống AI đáng tin cậy, chúng ta cần lấp đầy khoảng cách giữa dữ liệu huấn luyện tĩnh và thông tin thực tế động.
1. Vấn đề Ngưỡng Kiến thức (Tại sao)
Các mô hình LLM được huấn luyện trên các tập dữ liệu khổng lồ nhưng tĩnh với ngày kết thúc cố định (ví dụ: giới hạn tháng 9 năm 2021 của GPT-4). Do đó, các mô hình không thể trả lời các câu hỏi về sự kiện gần đây, cập nhật phần mềm hoặc dữ liệu riêng tư được tạo ra sau thời kỳ huấn luyện của chúng.
2. Ảo giác so với Thực tế (Tại sao)
Khi được hỏi về dữ liệu chưa biết hoặc vượt quá ngưỡng, các mô hình thường ảo giác—tạo ra những sự thật có vẻ hợp lý nhưng hoàn toàn sai để đáp ứng yêu cầu. Giải pháp là căn cứ: cung cấp bối cảnh xác thực và thời gian thực từ một cơ sở tri thức bên ngoài trước khi mô hình tạo ra câu trả lời.
3. RAG so với Tinh chỉnh (Làm thế nào)
- Tinh chỉnh: Việc cập nhật trọng số nội bộ của mô hình tốn kém về mặt tính toán, chậm và dẫn đến kiến thức tĩnh, nhanh chóng trở nên lỗi thời.
- RAG (Tăng cường sinh bằng truy xuất): Rất tiết kiệm chi phí. Nó truy xuất thông tin liên quan ngay lập tức và chèn vào prompt, đảm bảo dữ liệu luôn mới nhất và cho phép cập nhật dễ dàng cơ sở tri thức mà không cần huấn luyện lại.
Preprocessing (Cleaning and chunking the manual text into smaller, searchable segments before embedding).
"Answer only using the provided context. If the answer is not in the context, state that you do not know."